کاربرد رگرسیون مولفه های اصلی برای مجموعه داده های با مشاهدات دورافتاده و گم شده
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه
- author راضیه فرمانی اردهایی
- adviser مسعود یارمحمدی
- Number of pages: First 15 pages
- publication year 1390
abstract
در این تحقیق به بررسی داده های با بعد بالا، که شامل داده های دورافتاده و گمشده می باشند، پرداخته می شود. روش های مختلف رگرسیون مولفه های اصلی که می توانند در صورت وجود داده های دور افتاده و گم شد ه استوار باشند بررسی می شود. سپس رگرسیون مولفه های اصلی استوار به عنوان روش رگرسیونی که بخاطر بعد بالا در متغیرهای پاسخ و پیشگو از روش تعقیب تصویر و تحلیل مولفه های اصلی برا ی کا هش بعد استفاده می کند ، و در برابر داده های دور افتاده وگم شده استوار می باشند را شرح می دهیم. سپس با استفاده از روشهای شبیه سازی برازش مدلهای رگرسیونی به داده هایی که با داده های دور ا فتاده و گم شده آلوده شده ا ندرا مورد بحث قرار می دهیم. در پایان با مقایسه روش های مختلف رگرسیونی برازش شده به داده های شبیه سازی شده، روش استوارتر در مقابل داده های دور افتاده و گم شده معرفی می گردد.
similar resources
شناسایی نقاط دورافتاده در داده های نرمال بر اساس مقادیر Z اصلاح شده مشاهدات
در این مقاله، به دلیل اهمیت و گستردگی استفاده از توزیع نرمال، نمونه های مبتنی بر این توزیع در نظر گرفته شده، با استفاده از مقادیر برش وابسته به حجم نمونه، نقاط دورافتاده آنها شناسایی می شوند. برای به دست آوردن مقادیر برش بهینه یک مسا له تصمیم مطرح و به روشی کمبیشینه (مینیماکس) حل می گردد. در حل این مسا له از روش شبیه سازی بهره گرفته شده است .
full textتعیین نقاط دورافتاده ، مشاهدات با نفوذ و برآورد نیرومند برای مولفه های اصلی
تجزیه مولفه های اصلی یکی از روشهای چندمتغیره است که هدف آن یافتن ترکیباتی از p متغیر xp,...,x2,x1 جهت ایجاد شاخصهای غیرهمبسته zp,...,z2,z1 می باشد که این شاخصها به ترتیب بیشترین تغییرات را شامل می شوند.
15 صفحه اولتحلیل استوار داده های فضایی در حضور داده های دورافتاده
معمولاً تابع تغییرنگار که ساختار همبستگی دادههای فضایی را تعیین میکند و نقش پایه ای در تحلیل آنها دارد، نامعلوم است و لازم است براساس مشاهدات برآورد شود. وجود داده های دورافتاده در مشاهدات تاثیر نامناسبی در برآورد تغییرنگار و سایر بخشهای تحلیل دادههای فضایی همچون پیشگویی فضایی و برآورد پارامترهای روند دارد. در این مقاله ابتدا با استفاده از برآوردگرهای مقیاس، چند برآوردگر استوار جدید با ن...
full textمدل رگرسیون لجستیک چند حالته با مقادیر گم شده و کاربرد آن در بررسی بیماری گواتر
In large–scale sampling opeartions (e.g. nation-wide health surveys) we always face the problem of non-response item(s) and/or non-response unit(s). In fitting a model to the data we have two groups of variables, namely dependent and independent variables. Non-response may occur for any of these groups of variables. In this paper we assume Y as a categorical dependent variable with three levels...
full textآزمون تعیین خطای مشخص سازی مدل خطی عام برای داده های گم شده
در این مقاله مدل خطی عام را در تحلیل دادههایی که در آنها متغیرهای کمکی و متغیر پاسخ گم شدگی دارند، در نظر می گیریم. برای تعیین نیکویی برازش مدل خطی عام در حضور دادههای گمشده، آزمون جدیدی را بر اساس آزمون رمزی(1969) می سازیم. نشان می دهیم که تحت فرض صفر، آماره های آزمون در برخی از حالات از توزیع فیشر تبعیت می کند و در برخی از حالات به توزیع شبهفیشر میل میکند. علاوه بر این، عملکرد آمارههای آ...
full textشناسایی نقاط دورافتاده در داده های نرمال بر اساس مقادیر z اصلاح شده مشاهدات
در این مقاله، به دلیل اهمیت و گستردگی استفاده از توزیع نرمال، نمونه های مبتنی بر این توزیع در نظر گرفته شده، با استفاده از مقادیر برش وابسته به حجم نمونه، نقاط دورافتاده آنها شناسایی می شوند. برای به دست آوردن مقادیر برش بهینه یک مسا له تصمیم مطرح و به روشی کمبیشینه (مینیماکس) حل می گردد. در حل این مسا له از روش شبیه سازی بهره گرفته شده است .
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023